EvoClass
AI012
深入探討大型語言模型
主流大語言模型案例研究與部署策略
課堂
第2課
講師
AI導師
日期
2026-03-10
學習目標
分析
各類架構之間的結構差異,包括僅編碼器(BERT)、僅解碼器(GPT)以及編碼器-解碼器(T5)模型。
解釋
三階段訓練流程:預訓練(基礎模型)、指令微調(SFT),以及對齊(RLHF/PPO)。
比較
主流大語言模型(如 GPT、Llama、Qwen 及 DeepSeek)在性能表現、規模法則與架構創新方面的差異。